AI资讯新闻榜单内容搜索- 大模型

ICML 2026 Spotlight| 拒绝盲目猜token，阿里x浙大将投机解码带入弹性预算时代

随着大模型参数规模持续扩大，推理成本已经成为生产级 LLM 服务的核心瓶颈。投机解码（Speculative Decoding, SD）通过「小模型 draft + 大模型 verify」的方式，将多个候选 token 放到一次目标模型前向中并行验证，从而缓解自回归解码的串行瓶颈。

来自主题: AI技术研报

8845 点击 2026-05-13 15:01

ICML 2026 | 大模型内部也会长出「情绪树」，规模越大越懂人心

随着语音、视频、多模态能力不断融入大语言模型（LLM），人与 AI 的交互正在越来越接近自然对话。今天的 LLM 不再只是回答问题的工具，也越来越多地出现在教育、客服、陪伴、心理健康等高度依赖情绪理解的场景中。

来自主题: AI技术研报

6722 点击 2026-05-12 14:31

独家｜RoboScience 机器科学完成10亿元融资，资金将用于强化 VLOA 大模型与本体

独家获悉，RoboScience 机器科学于近日完成十亿元 A 轮融资，投资方包含多家国内外知名产业巨头及一线财务机构。本轮融资将用于持续深化其核心的 VLOA 大模型技术，以及推进自研机器人本体的工程化与量产，加速通用具身智能解决方案的规模化落地。

来自主题: AI资讯

9568 点击 2026-05-06 09:20

不可思议！400B大模型在iPhone上跑起来了

刚看到这个 Demo 的时候着实有些想笑，很久没有见过吐词如此之慢的大模型了。观感上就像「闪电」老师。尽管只有每秒 0.6 个 tokens 的输出速率，这依旧是一个令人不可思议的工作。因为这是一个跑在 iPhone 17 Pro 上的 400B 大模型！

来自主题: AI资讯

10502 点击 2026-05-02 11:02

GPT之父震撼发布远古 talkie 大模型，不知道二战和互联网，却从几个例子学会了Python

你敢信？一个活在95年前的AI，竟写出了Python代码。GPT之父下场，用2600亿Token炼出了一个「老古董」AI——「talkie」。

来自主题: AI资讯

9224 点击 2026-04-29 14:43

字节 Seed 大模型人才外溢

被动成为新一代 AI 黄埔军校的字节跳动。

来自主题: AI资讯

10299 点击 2026-04-09 09:47

罗福莉：Claude订阅封杀龙虾背后，真正的出路不是更便宜的token

Agent 时代，我们需要正确的计费和工程设计哲学，这是 Xiaomi MiMo 大模型负责人罗福莉刚刚在 X 上发表的观点。前两天，我们报道了一则消息 ——Anthropic 宣布，即日起，Claude Pro 和 Max 订阅用户，不得再将订阅额度用于 OpenClaw 等第三方 Agent 框架。想继续用？那就必须切换到按用量付费的 API。

来自主题: AI资讯

8632 点击 2026-04-06 09:51

算法备案 vs 大模型备案到底是什么？一文搞定！

两个备案概念都涉及"AI"，为啥就是不一样？合规路径+完整流程+避坑清单，看完就懂！

来自主题: AI监管政策

11133 点击 2026-04-02 09:39

国产大模型杀疯了，MiniMax-M2.5即将开源！

这两天 AI 圈真的太热闹了，就在网传 DeepSeek 要更新支持 100 万 Token 上下文的新模型时，MiniMax 率先冲锋，更新了他们的新旗舰模型：MiniMax-M2.5。更有意思的是，国外网友这段时间对国内 AI 大模型的更新节奏格外关注，他们甚至把这种争先更新的现象称为：Happy Chinese new year！

来自主题: AI资讯

11556 点击 2026-02-12 18:07

决定了：过年攻略全都不过脑子，让AI去想

春节还没到，「过年的气氛」已经渗入科技圈每个人的毛孔。单说 AI 大模型这一块，刚刚发布的有 kimi 2.5 和 Step 3.5 Flash，即将发布的据说还有 DeepSeek V4，GPT-5.3、Claude Sonnet 5、Qwen 3.5，GLM-5，说不定一觉醒来，现有的技术就要被颠覆。

来自主题: AI技术研报

7112 点击 2026-02-12 15:32